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(57) Abstract 

The invention relates to novel tumour suppressor genes of the p53 family, to polypeptides which code them and to their use. It 
preferably relates to nucleic acids which code KET, especially those of rats, humans and mice. 

(57) Zusammenfassung 

Die Ernndung betrifft neue Tumorsuppressorgene der p53-Familie, Polypeptide die sie kodieren, sowie ihre Verwendung. Bevorzugt 
betrifft sie KET-kodierende Nukleinsauren, insbesondere der Ratte, des Menschen und der Maus. 
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Tumorsuppressorgerie der p53-Familie 

Die Erfindung betrifft neue Tumorsuppressorgene der p53-Familie, Polypeptide, 
die sie kodieren sowie ihre Verwendung. Bevorzugt betrifft sie KET-kodierende 
Nukleinsauren, insbesondere der Ratte, des Menschen und der Maus. 

Gene, die in der Tumorigenese eine maftgebliche Rolle spielen, konnen aufgrund 
ihrer funktionellen Wirkweise grob klassifiziert werden. Fuhrt eine Gain-of- 
function-Mutation zu einem Allel, das auf die Tumorigenese aktivierend wirkt, so 
wird das betroffene Gen als Oncogen bezeichnet. 1st eine Loss-of-function- 
Mutation auf beiden Allele notig (inaktivierend), um tumorigene Veranderungen 
moglich werden zu lassen, spricht man von einem Tumorsuppressor-Gen. Das 
prbminenteste und meist untersuchte Tumorsuppressor-Gen kodiert fur den 
nuklearen Transkriptionsfaktor p53 (uber 2000 Medline Eintrage im vergangenen 
Jahr; NCBI-Datenbank) mit der Hauptfunktion in der Kontrolle des Zell-Zyklus' 
und der Apoptose (Levine 1997). p53 liegt in humanen Tumoren zu uber 50 % 
mutiert vor (Hollstein et al. 1991), vererbte p53 Mutationen fuhren zu einer 
erhohten Tumorhaufigkeit bei den Tragern des defekten Allels (Evans und 
Lozano 1997). Derzeit existieren vier p53-knock-out Mauslinien, die von 
mehreren Arbeitsgruppen unabhangig voneinander hergestellt wurden und als 
Tiermodelle fur den Menschen dienen. p53-defiziente Tiere (Genotyp: +/- und -/-) 
zeigen schon im fruhen Alter eine vermehrte Tumorrate (Donehower et al. 1992, 
Harvey et al. 1993b). Die Embryo- und Organogenese verlauft jedoch im 
ailgemeinen unauffaliig, so da& p53 defiziente Tiere nicht von ihren +/+ 
Wildtypgeschwistern zu unterscheiden sind (Donehower et al. 1992). Allerdings 
zeigen einige p53 -/- Embryonen am Tag 13.5 der Embryogenese einen 
charakteristischen Defekt in der Morphologie des Kopfbereiches, eine 
Exencephalie, bei der der VerschluS des Neuralrohres in Vorder und Mittelhirn 
nicht erfolgt. Diese MiGbildung tritt bei 16 % der homozygot-defizienten CV 129 
Embryonen auf, wahrend nur 8 % von CV129 X C57BU6- p53 -/- 
Hybridembryonen betroffen sind. Interessanterweise variiert auch die 
Tumorinzidenz im CV129 Hintergrund und CV129 X C57BL/6 Hybridhintergrund. 
Tumoren entwickeln sich generell schneller in CV 129 Mausen als in CV 129 X 
C57BL/6-Hybriden; zusatzlich kommt es in CV 129 Tieren vermehrt zu 
Teratomen (Donehower et al. 1995, Harvey et al. 1993a). Solche Unterschiede 
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konnen nur durch die jeweils unterschiedliche Konstitution des genetischen 
Hintergrundes erklart werden. Das zeigt im unterschiedlichen genetischen 
Hintergrund das Vorliegen differenzierter Kompensationseffizienz gegenuber dem 
p53-Verlust und die Existenz verwandter Gen-Produkte, welche die Funktion von 
p53 wahrend der Embyogenese und Cancerogenese verrichten. 

Der Erfindung lag deshalb die Aufgabe zugrunde, entsprechende Gene 
bereitzustellen, die fur Proteine kodieren, welche bei der Kontrolle des Zeil-Zyklus 
und der Apoptose eine Rolle spielen. 

Die Erfindung basiert auf der Erkenntnis, daft das Protein KET mit so 
bemerkenswerter Homologie in seiner Aminosauresequenz zu p53 gefunden 
wurde, daft es mit p53 in einer p53-Famiiie zusammengefa&t werden kann. Wie 
p53 besitzt KET eine Transaktivierung-, eine DNA-Bindungs- und eine 
Oligomerisierungsdomane. Der hochste Grad an Homologie ist in der DNA- 
Bindungs-Domane zu finden. Er betragt zwischen KET und p53 75%. Die 
Isolierung der kodierenden cDNAs erfolgte aus der Ratte (SEQ ID No. 1). 

Erfindungsgemafc wurde die menschliche KET cDNA (SEQ ID No. 2) kloniert; ein 
Alignment der abgeleiteten Aminosauresequenz (SEQ ID No 3) mit der aus Ratte 
und den Sequenzen von humanem p53 und p73 ist in Abb. 1 gezeigt. Die KET- 
Aminosaure-Sequenz aus der Ratte zeigt eine Homologie von 98 % zu der des 
Menschen. 

Es wurde eine chromosomale Lokalisation des Gens auf dem Chromosom 3q des 
Menschen und 16 der Maus (vgl. Abb. 2 Genetische Kartierung) gefunden, 
woraus sich auf eine Funktion von KET als Tumorsuppressor ruckschliefcen lafit. 
Interessanterweise kartiert das Kef-Gen der Maus in einen Bereich, der in fruhen 
Stadien der Pancreaskanzerogenese deletiert ist und vermutlich einen 
Suppressor der Angiogenese, Loh2 (Gensymbol: Loh2), beinhaltet, fur den Ket 
somit einen Kandidaten darstellt. 

GemaB der Erfindung wurde festgestellt, daft das KET-Protein bei der 
Tumorsuppression beteiligt ist. Von speziellem Interesse waren vor allem solche 
Tumoren, in denen bisher keine Veranderungen des p53 Wildtypallels 
beschrieben wurden. Die chromosomale Lokalisation der verantwortlichen 
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Tumorsuppressorgene kann durch cytogenetische Anaiysen, die Loss of 
heterozygosity (LOH)-Bereiche identifizieren, vorausgesagt werden. Es wurde 
nachgewiesen, dafl das KET/Ket-Gen bei Mensch oder Maus in solche LOH- 
Regionen kartiert. 

Erfindungsgemaft erfolgte eine Kartieaing des KET/Ket-Gens bei Mensch und 
Maus mit flankierenden Markern (Abb.2). Zur prazisen chromosomalen 
Lokalisation beim Menschen wurden Bestrahlungshybride (Radiation Hybrids; 
GeneBridge 4 Panel, Research Genetics) eingesetzt, die Kartierung bei der Maus 
erfolgte in einer M. musculus X M. spretus Ruckkreuzungsgeneration. Das Kef- 
Gen kartiert zwischen das Somatostatin-Gen und das Apolipoprotein D Gen auf 
Chr. 3q des Menschen. Dieselbe Genreihenfolge wurde auf Chr. 16 der Maus 
bestatigt. A (links) chromosomaler Abschnitt des humanen Chromosoms 3q mit 
der Position des KET-Locus; B (mitte) Position des Kef-Locus auf Chr. 16 der 
Maus. C (rechts) Ket-Haplotypen und Markergene auf Chr. 16. Jede Saule 
reprasentiert zwei Haplotypen von Chr. 16, die Anzahl der Backcross-lndividuen 
ist unten angegeben (obere Zahl: gefullte Quadrate/Rechtecke SEG/1 Allel; leere 
Quadrate/Rechtecke C57BL6J Allel; untere Zahl: das Gegenteil) 
Gensymbole: CKCN2/Clc2 - Chlorid-Channel 2; SST/Smst - Somatostatin; 
KET/Ket - p53 verwandtes Protein KET; APOD/Apod - Apolipoprotein D; 
GAP43/Gap43 - Wachstum beeinfluSendes Protein 43. 

Gegenstand der Erfindung sind deshalb die KET-Nukleinsauren, vorzugsweise 
KET-cDNA der Ratte, des Menschen und der Maus sowie deren Fragmente, 
Varianten und Mutationen, vorzugsweise die SEQ ID No.1 (KET-cDNA der Ratte) 
und die SEQ ID No. 2 (humane KET-cDNA). 

Fragmente, Varianten und Mutationen sind durch Basenaustausche 
gekennzeichnet. Weiterhin konnen auch alle T durch U ersetzt sein 
(Ribonukleinsaure) . 

Ferner sind Gegenstand der Erfindung die Polypeptide fur die die cDNAs 
kodieren, vorzugsweise SEQ ID No. 3, und deren an einer Oder mehreren Stellen 
durch Austausch von Aminosauren geanderte Strukturen. 
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Die Herstellung erfolgt nach an sich bekannten Verfahren, wie z. B. durch 
Isolierung und Sequenzierung aus cDNA-Bibliotheken. 

Desweiteren betrifft die Erfindung die Verwendung der KET-Nukleinsauren und 
Polypeptide als Ausgangsbasis zur Entwicklung spezifischer und wirkungsvoller 
Cancerostatika. Sie werden zum Aufbau von Genen und Vektoren eingesetzt, die 
die Basis fur die Entwicklung dieser pharmazeutisch relevanten Substanzen 
darstellen. 

Aufterdem werden sie zur Entwicklung diagnostischer Kits eingesetzt, so z.B. zur 
Vorhersage eines Krebsrisikos. Gegenstand sind demzufolge auch diagnostische 
Testkits. 

Weiterhin erfolgte die Charakterisierung von genomischen Ket-Klonen des 
Menschen und der Maus durch die differentielle Darstellung von intron- 
umspannenden PCR-Fragmenten. Diese PCR-Tests wurden auch fur die 
Identifizierung von Kef-positiven BACs (Bacterial artificial chromosome) in einer 
genomischen BAC-Bibliothek (Genome Systems Inc) verwendet. Diese BACs 
enthalten DNA aus dem CV 129/J Mausstamm, so dali Subfragmente des BAC- 
Klones direkt zur Konstruktion des Kef-Targeting-Vektors eingesetzt werden. Auf 
den bisher identifizierten BACs befanden sich auch die ersten 5'-Exons. Aus der 
full-length KET-cDNA Sequenz des Menschen und der Ratte wurden 
Primersequenzen abgeleitet, die zu Maus Exon 1 spezifischen PCR-Tests 
fuhren. 

Daruber hinaus wurden Kef-defiziente Mause hergestellt. 

Die Herstellung von Mausen, die Nullallele des Kef-Gens tragen, erforderte vier 
aufeinanderfolgende Prozesse: 

• Isolierung und Charakterisierung eines geeigneten Abschnittes des Zielgenes. 

• Klonierung eines Targeting-Vektors, in dem der offene Leserahmen des 
Zielgenes durch die Integration eines Selektionsmarkers (vollstandige 
Transkriptionseinheit fur das Neomycin-Resistenz-Gen) zerstort ist. 

• Homologe Integration des Rekombinationskonstruktes in das Genom von 
embryonalen Stammzellen und anschlieBende Selektion auf die Antibiotika- 
Resistenz. 



WO 99/61610 r PCI7DE99/01557 



• Injektion von ESCs in Blastocysten (oder Kokultur mit Morulae) und 
anschlieBender Uterustransfer. 

Gegenstand sind auch Targeting-Vektoren. In einer Ausfuhrungsvariante wurde 
der bereits vorliegende BAC nach Verdau mit geeigneten 
Restriktionsendonukleasen in pBluescript oder pUC subkloniert (optimale GrolJe 
der Subklone 5-10 kb). Clber weitere Restriktionskartierung und STS-Mapping (Sequence 
Tagged Sites) mittels PCR und/oder Southern blotting wurde ein Subklon-Kontig 
erstellt, das als eine Feinkartierung des 5'-Genbereichs angesehen werden kann. 
Hierzu wurde die cDNA-lnformation aus Mensch und Ratte verwendet. Generell 
kann die Unterbrechung des offenen Leserahmens an zwei Stellen erfolgen: Es 
wurde in einem Fall die ersten translatierten Exons und im anderen die gesamte 
putative DNA-Bindungs-Domane ausgeschaltet. Um die gewebsspezifische 
Expression von Ket wahrend der Embryo- und Organogenese in Chimaren und 
Kef-defizienten Mausen zu verfolgen, wurde zusatzlich eine S-Galactosidase- 
Kassette so einkloniert, daS sie der Kontrolle des Kef-Promoters unterliegt. 
Generell waren zwei Formen des gezielten Gentargeting moglich: Bei 
Verwendung eines Insertionsvektors integrierte der komplette Vektor (ein 
Crossover-Ereignis war erforderlich), bei dem gebrauchlicheren 
Replacementvektor integrierte lediglich ein Teil, der von der Wahl intragener 
Restriktionsschnittstellen abhangig war (zwei Crossover-Ereignisse erforderlich). 

Genausschaltung in embryonalen Stammzellen (ESCs) 

Wie schon oben aufgefuhrt, ist die verwendete genomische BAC-Bibliothek CV 
129-Ursprungs. Aus diesem Mausstamm wurden auch die meisten 
gebrauchlichen ESCs isoliert. Der Vorteil der Verwendung von isogenem Material 
liegt in der hoheren Wahrscheinlichkeit zur homologen Rekombination. ESCs 
wurden nach Transfektion (Elektroporation) durch G418-Selektion uberpruft. Im 
Falle des Replacement-Vektors wurde zusatzlich eine Vektor-interne 
Thymidinkinase-Kassette zur negativ-Selektion (Gancyclovir) bei nicht homologer 
Integration genutzt. 

Eine erfolgreiche homologe Rekombination wurde uber DNA-Analysen (Southern- 
Blot) gepruft. 

Durch die Injektion von so geanderten ESCs in Blastocysten wurden auch 
Embryonalchimaren hergestellt und diagnostiziert. 
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Fur die Blastocysteninjektion Oder Morula-Aggregation wurden nur genotypisierte 
ESCs verwendet. Chimare Praimplantations-Embryonen wurden in die 
Uterushdrner von scheinschwangeren Rezipientenmausen ubertragen. Chimaren 
wurden in Testverpaarungen auf eine erfolgte Keimbahntransmission von ESC- 
Abkdmmlingen uberpruft. F17F2 Nachkommen von Chimaren, die das Ker Null- 
Allel entweder hetero- Oder homozygot tragen, wurden mittels Southern-Blot- 
oder PCR-Analysen genotypisiert. 

Weiterhin ist die Erfindung durch ein Beispiel und ein Sequenzprotokoll naher 
erlautert. 

Beispiel 

Gewinnung der humanen KET-cDNA (SEQ ID No. 2) 

Fur die Gewinnung von humaner KET-cDNA wurden 1 x 10 6 Klone einer 
menschlichen Skelettmuskel-cDNA-Bibliothek (Stratagene) mit Proben uberpruft. 
die einer Ratten-KET-cDNA entstammten (Schmale und Bamberger, 1997). Ein 
einziger positiver Klon, hu41m, wurde gewonnen und das Insert von 3226 bp 
wurde unter Verwendung vektorspezifischer und interner Primer - in zwei 
Richtungen sequenziert. Das Insert enthielt einen offenen Leserahmen von 1360 
bp, homolog zum N-Terminus der Ratten-KET-Sequenz, die Kodiersequenz war 
jedoch nach dem QQHQHLLQ-Motiv an Position 448 durch eine unbekannte 
Sequenz unterbrochen. Die Oberprufung- von 6 x 105 Klonen einer menschlichen 
Keratinocyten-cDNA-Bibliothek (Clontech) mit einer Probe, die vom 3'-Ende von 
hu41m stammte, ergab zwei ubereinandergreifende Klone, hu6k und hu10k, die 
mit einem Teil des cDNA-Klons hu41 identisch waren und die Sequenz zum 3'- 
Ende hin verlangerten. Urn 3'-Endsequenzen zu erhalten, wurde die EST- 
Datenbank mit dem nichttranslatierten 3'-Bereich des Ratten-KET-Klons 
durchforscht. Nach Feststellung mehrerer homologer EST-Klone wurden zwei 
davon (I.M.AG.E. Consortium Klon ID 149663 und 137665) vollstandig 
sequenziert. Fur die Amplifikation und direkte Sequenzierung eines 1,2 Kb- 
Fragmentes aus der menschlichen Haut-cDNA wurden PCR-Primer gemali dem 
3"-Ende des cDNA-Klons hu10k und dem 5*-Ende des EST-Klons 149663 
verwendet. Die vollstandige cDNA enthalt 4846 bp, einschlieSlich 27 bp des 
hochstwahrscheinlich verkurzten nichttranslatierten 5'-Bereichs und 2776 bp des 
nichttranslatierten 3'-Bereichs . Urn die benachbarte Anordnung der aus 
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verschiedenen Quellen gewonnenen Sequenzen zu demonstrieren, wurden 
PCR-Primer, die gemafi der Translationsstart- und -stoppkodons positioniert 
waren, fur die Amplifikation der vollstandigen Proteinkodierungssequenzen des 
KET von menschlicher Haut-cDNA verwendet. Die cDNA enthalt einen offenen 
Leserahmen. der fur 680 Aminosauren kodiert (Abb. 1). Dem vermutlichen Start 
Methionin geht ein Translationsstoppkodon (nicht dargestellt) im Raster voran. 
Ein Vergleich der Aminosauresequenzen der KET von Menschen und Ratten 
zeigt eine 98 %-ige Identitat (Abb. 1). Diese beachtliche interspezifische 
Konservierung von KET-Proteinen erstreckt sich uber die gesamte Molekullange. 
Sie ist im Mittelteil, der den DNA-Bindebereich enthalt, sogar noch ausgepragter. 
248 Aminosauren sind vdllig unverandert. Die KET-Proteine sind weitaus 
konservierter als die entsprechenden p53-Proteine vom Menschen und von 
Ratten, die zu insgesamt 79 % homolog sind. Lediglich im DNA-Bindebereich 
erreicht ihre Identitat 91 %. Menschliches p73 zeigt eine Identitat von insgesamt 
58 % mit menschlichem KET. Die Konservierung ist wiederum im DNA- 
Bindebereich mit einer Identitat von 86 % am hdchsten. wahrend der N-terminale 
Bereich, mit Ausnahme des Transaktivierungsbereichs, am meisten abweicht. 
AufJer dem Transaktivierungs- und dem DNA-Bindebereich weisen p53, p73 und 
KET einen gut erhaltenen Oligomerisationsbereich gemeinsam auf. Es ist 
wahrscheinlich, daB die drei Proteine in der Lage sind, Mischoligomere zu bilden, 
die spezifische biologische Funktionen haben. 

Bei Proteinen, die aus funktionellen Grunden keine Veranderung tolerieren 
konnen, wie solche, die Mehrfachbindestellen aufweisen, sind 
Aminosauresequenzen im allgemeinen so gut erhalten, wie das bei KET vom 
Menschen und von Ratten zu beobachten ist. Diese Konservierung lafit 
vermuten, daS KET ein evolutionares altes Gen sein kann, das wahrscheinlich 
bei der Entwicklung und Differenzierung hdherer wirbelloser Tiere und Wirbeltiere 
in die allgemeinen Grundfunktionen einbezogen wurde. p53 kann sich spater von 
seinem Vorlaufergen als Protein weiterentwickelt haben, das fur spezifische 
Funktionen wie die Oberwachung von Genomschaden verantwortlich ist. Der Umfang der 
genotoxischen Belastung hangt von physiologischen Faktoren und 
Umweltfaktoren ab, die, zumindest teilweise bei den verschiedenen Arten 
unterschiedlich sind. So kann die relative Vielgestaltigkeit von p53, im Vergleich 
zu KET, die.artspezifischen Anforderungen an ein solches System widerspiegeln. 
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Fur das Kartierungsverfahren auf der Grundiage von PCR wurden STS vom 
Menschen (hKET8) und zwei KET STS von Mausen (muKET8 und muKET)) 
amplifiziert (s. Tab. 1). 

Die Primerpositionen wurden so definiert, daB Fragmente entstanden sind, die 
ein Intron, flankiert von Exonsequenzen, enthalten. Das ermoglichte die 
Identifizierung richtiger PCR-Fragmente durch einen Vergleich mit der bekannten 
KET-cDNA-Sequenz von Ratten. Speziell fur die Kartierung des Ket-Gens von 
Mausen haben wurden intronhaltige PCR-Fragmente gewahlt, urn nach einer 
Restriktion mit geeigneten Endonucleasen leicht nachweisbare Fragment- 
Langen-Polymorphismen zu erhalten. Die Exon-lntron-Grenzen wurden durch 
einen Vergleich der KET-Aminosaurensequenz mit der von p53 und p73 
(Schmale und Bamberger, 1997; Kaghad et al, 1997) abgeleitet. Die 
Exonsequenzen entsprachen der KET-Aminosaurensequenz des Menschen 
(Abb. 1) wie folgt: hKET9, Aminosaurereste 360-390; muKET8, Aminosaurereste 
360 - 400; muKET9, Aminosaurereste 383 - 438. PCRs wurden, wie bereits 
beschrieben (Lengeling et al, 1995), durchgefuhrt. Nukleotidsequenzen von 
Primern fur den Mit-Mikrosatellitenmarker D16Mit57 wurden aus der MIT- 
Mausgenomdatenbank gewonnen. Maussegregationsdaten wurden mit dem 
GENE-LINK Computerprogramm (Montagutelli, 1990) verarbeitet. hKET8, das 
Intron 8 umfafct, wurde mittels . der GeneBridge 4 
Strahlungshybridkartierungspanels kartiert (Research Genetics, Huntsville, AL). 
Dieses Panel stellt 91 Strahlungshybridklone des gesamten Humangenoms dar. 
Das KET-Gen wurde am Humanchromosom 3q27 zwischen den 
Mikrosateilitenmarkern D3S1580 und D3S1314 kartiert (Abb. 2A). Die 
wahrscheinlichste Genreihenfoige und -abstande waren D3S1580 - 2,2 cR - Wl- 
6145 - 7,1 cR - KET — 4,7 cR - W71189 - 8,9 cR - D3S1314. Dieser Bereich ist 
von Somatostatin-, SST (O'Hara et al, 1988) und Apolipoprotein D, APOD 
(Warden et al, 1992) flankiert. Informationen uber die chromosomale 
Lokalisierung von SST und APOD und die Genreihenfoige wurden der 
Chromosomen 3-Karte entnommen (San Antonio Genome Center; 
http://genome.uthcsa.edu/Maps/frame.html). 

3q27 ist der mittlere Teil eines Bereich einer gut dokumentierten Syntenie zum 
Mauschromosom 16, der sich von CLCN2 nach GAP43, bzw. C/c2 nach Gap43 
im Mausgenom erstreckt (DeBry und Seldin, 1996; Lengeling et al, 1995). Urn 
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festzustellen, ob der Maus-Ket-Locus in den homologen Bereich fallt, erfolgte 
eine Kartierung des Ket-Gens unter Verwendung einer Interspeziesruckkreuzung 
der Maus (C57BL/6J wrt + xSEG/1 +/+)*Fi wrf/+ x (C57BU6J wrf+J, die 
ursprunglich fur die Kartierung des Wobbler-Gens etabliert wurde (Kaupmann et 
al, 1992). Dieses Interspeziesruckkreuzungspanel wurde fur uber 150 Loci 
charakterisiert, die uber alle Autosome und die X-Chromosomen verteilt waren. 
Es wurde eine verbesserte Karte des Chromosoms 16 fur die Kartierung des 
Chloridkanalgens Clc2 geschaffen (Lengeiing et al, 1995). Beide Maus-KET- 
PCR-Fragmente lieferten informative Restriktionsfragmentlangenvarianten 
(RFLVs), die fur die Segregationsanalyse verwendet wurden. Das Fragment mit 
Intron 8 (muKET8) wurde mit Msp1 geschnitten, muKET9 mit Rsa1. KET wurde 
zwischen Smst und D16MH63 entdeckt mit Lodserves > 8 (Abb. 2B,C). Das 
Maushomologe des menschlichen Apolipoproteins D, Apod, der Genmarker an 
menschlichem Chr 3q eng verbunden distal zu KET, wurde im M. musculus x M. 
Spretus Ruckkreuzungspanel nicht kartiert, jedoch sind detaillierte 
Kartierungsdaten verfugbar (Reeves und Cabin, 1997; Warden et al, 1992; 
Reeves et al, 1997). Es wurde D16Mit 57 kartiert, das distal zu Apod (Reeves 
und Cabin, 1997) angeordnet ist und einen Polymorphismus von Fragmentlange 
zwischen dem M. musculus C57BL/6J (111 bp) und M. spretus SEG/1 (135 bp) 
nutzt Bei 50 Meiosen wurde keine Rekombination von Ket und D16MH57 
festgestellt. Auf der Ruckkreuzungstafel von M. musculus x M. spretus waren die 
wahrscheinlichsten Genreihenfolge und -abstande Cen - D16MH87 - 3,9 ± 1,7 
cM - Smst, D16Mit102 - 4 ± 2,77 cM - Ket, D16M'tt 57 - 14 ± 4,91 cM - 
D16MH63, 

Der Verlust des langen Arms von Chromosom 3 wird selten festgestellt (vgL 
Chitayat et ai, 1996). Die Symptome mit Eliminierungen 3q27-»qter 
unterscheiden sich erheblich und reichen nicht aus, urn ein spezifisches Syndrom 
abzuleiten. Wahrend in zwei Fallen lediglich kleinere faziale Abnormitaten, 
Verzogerungen in der Entwicklung und Hypotonien berichtet wurden, zeigten 
andere ernsthafte, mehrfache kongenitale Abnormitaten, einschlieftlich 
Anophtahlmie und Himathrophie. 

In einigen Humankrebsgeweben (z.B. osophagealem Krebs und squamose 
Karzinomen) wurden LOH-Bereiche an Chr 3 entdeckt, die 3q27 enthielten (Sato 
et al, 1994; Wang et al, 1996). Obwohl statistisch von Bedeutung, war ein Verlust 
von 3q, der im Vergieich zu anderen chromosomalen Abnormitaten mit einer 
reiativ geringen Haufigkeit auftrat, bei diesen Tumoren zu beobachten. 
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Vergieichende Kartierungsdaten zeigten Bereiche einer vollig erhaltenen 
Syntenie zwischen Chr 3q und den Mauschromosomen 3, 9 und 16 (vgl. DeBry 
und Seldin, 1996), wovon zwei die vorhergesagten Suppressorgene Loh1 und 
Loh2 beherbergen, die auf ausgepragten Stufen der Tumorentwicklung in einem 
transgenen Mausmodell des Inselzellkarzinoms (Dietrich et al t 1994; Parangi et 
al, 1995; Shi et al, 1997) deletiert werden. Das Ket-Gen falit in den gleichen LOH- 
Bereich mit Loh2 (LOH etwa 15 cM, 14-29 cM von Cen, flankiert durch die 
Mikrosatellitenmarker D16MH35 und D16MH39; (vgl. Parangi et al, 1995). Von 
Loh2 wird angenommen, daS es einen Suppressor der Angiogenese (Parangi et 
al, 1995) kodiert. Tatsachlich wurde gezeigt, daft das Protein p53 die 
Angiogenese in Fibroblasten indirekt hemmt durch die positive Regulierung der 
Thrombospondin-1 -Expression (Dameron et al, 1994). Daher ist Ket ein Kandidat 
fur Loh2 durch seine chromosomale Lokalisierung und durch seine putative 
Funktion. 

Tabelle 1 



PCR Primer fur STS aus den KET/Ket Regionen 



STS 


Sequenz (5' ->3') 


GroGe (bp) 


Temperierung Referenz 


hKET8 


CAGAAAGCAGCAAGTTTCGGAC 
TGGATGTCATCTGGATACCATG 


750 


55°C 


muKET8 


CAGAAAGCAGCAAGTTTCGGAC 
AGCTCATCATCTGGGGATCTCC 


2 T 300 


65°C 


muKET9 


AC AC GG AATC C AGATG ACTTCC 
TGCTGCCTGTACGTTTCGATCG 


3,100 


65°C 


D16MU57 


AAAAAATT T I AAACCATGTGAATGT 
TGAAGTTTATTATGAGTTGAATCATGC 


111 

135° 


63°C MIT 



Grdfce des Amplifizierungsproduktes mit C57BU6J DNA; n (SEG/1) 
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Patentanspruche 

1. KET-kodierende Nukleinsauren, Fragmente, Varianten und Mutationen. 

2. KET-Nukleinsauren nach Anspruch 1, gekennzeichnet durch die KET-cDNA 
der Ratte mit der Sequenz SEQ ID No. 1 sowie deren Fragmente, Varianten 
und Mutationen. 

3. KET-Nukleinsauren nach Anspruch 1, gekennzeichnet durch die humane 
KET-cDNA mit der Sequenz SEQ ID No. 2 sowie deren Fragmente, Varianten 
und Mutationen. 

4. KET-Nukleinsauren nach einem der Anspruche 1 bis 3, dadurch 
gekennzeichnet, dafc T durch U ausgetauscht ist. 

5. KET-Nukleinsauren nach einem der Anspruche 1 bis 4, dadurch 
gekennzeichnet, daG sie vollstandig komplementar ist. 

6. Polypeptide, fur die KET-Nukleinsauren gemafl einem der Anspruche 1 bis 5 
kodieren. 

7. Polypeptide nach Anspruch 6 gekennzeichnet durch die SEQ ID No. 3 sowie 
deren an einer oder mehreren Stelien durch Austausch von Aminosauren 
geanderte Strukturen. 

8. Vektoren, die eine KET-Nukleinsaure Oder fur KET-Polypeptide kodierende 
DNA nach einem der Anspruche 1 bis 5 enthalten. 

9. Wirtszellen, die die Vektoren gemali Anspruch 8 enthalten. 

10. Verwendung von KET-Nukleinsaure oder Polypeptiden nach einem der 
Anspruche 1 bis 7 zum Nachweis von KET-Nukleinsauren in biologischen 



Proben. 



H.Verwendung nach Anspruch 10, dadurch gekennzeichnet, daG man eine 
biologische Probe mit mindestens einer Verbindung dieser Nukleinsauren, 
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vorzugsweise mit den Verbindungen der SEQ ID No. 1, SEQ ID No. 2 
und/oder SEQ ID No. 3, ggf. mit einem Tragermolekul nach an sich ublichen 
Methoden in Kontakt bringt und der Nachweis anhand des gebiideten 
Hybridisationskompiexes durch physikalische oder chemische Methoden 
erfolgt. 

12. Verwendung nach Anspruch 10 oder 11, dadurch gekennzeichnet, dafc die 
Nukieinsaure DNA ist, die ggf. eine homozygotische Deletion enthalt. 

13. Verwendung nach Anspruch 10, dadurch gekennzeichnet, da& die 
Nukieinsaure RNA ist. 

14. Verwendung nach einem der Anspruche 10 bis 13, dadurch gekennzeichnet, 
daG die Nukieinsaure markiert ist, vorzugsweise durch ein Radioisotop, eine 
biolumineszente, eine chemilumineszente oder fiuoreszente Verbindung, ein 
Metallchelat Oder ein Enzym. 

15. Verwendung nach einem der Anspruche 10 bis 14, dadurch gekennzeichnet, 
daE die biologische Probe Tumorgewebe mit erfolgter Angiogenese des 
Menschen oder der Maus ist. 

16. Verwendung von KET-Nukieinsauren nach einem der Anspruche 1 bis 5 zum 
Nachweis der G eg en wart oder Abwesenheit des menschlichen Chromosoms 
3q27 oder dessen Fragmenten anhand des Hybridationsproduktes zwischen 
chromsomaier DNA und der KET-Nukleinsaure. 

17. Verwendung von KET-Nukleinsauren nach einem der Anspruche 1 bis 5 zum 
Nachweis der Gegenwart oder Abwesenheit des Mauschromosoms 16 oder 
dessen Fragmenten anhand des Hybridationsproduktes zwischen 
chromsomaier DNA und der KET-Nukleinsaure. 

18. Testkit zum Nachweis Oder Veranderungen von KET-Nukleinsauren 
enthaltend 

- mindestens eine KET-Nukleinsaure Oder ein Polypeptid gemaS einem der 
Anspruche 1 bis 7 Oder eine Hybridisationsprobe. 
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SEQUENZPROTOKOLL 

(1) ALLGEME I NE INFORMATION: 

U) W S) L S:: Fraunhofer-Gesellschaft *ur FSrderung der 
angewandten Forschung e.V. 

(B) STRASSE : Leonrodstr . 68 

(C) ORT: MQnchen 

(E) LAND: Deutschland 

(F) POSTLEITZAHL: D-80636 

(ii) ANMELDETITEL: Tumorsuppressorgen der p53-Familie 
(iii) ANZAHL DER SEQUENZEN: 3 

(iv) COMPUTER- LE SHARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

<D) SOFTWARE : Patentln Release #1.0, Version #x.2S C»«u 

(2) INFORMATION ZU SEQ ID NO: 1: 

(i) SEQUENZ CHARAKTERI S T I KA : 

(A) LANGE: 4708 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKttLS : cDNS 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 
TAAGTGAGTT CCTCAGCCCA GAGGTGTTCC AGCATATCTG GGATTTTCTG GAACAGCC TA 
TATGCTCAGT ACAGCCCATC GACTTGAACT TTGTGGACGA ACCATCAGAA AATGGTGCAA 
CAAACAAGAT TGAGATTAGC ATGGATTGTA TCCGCATGCA AG AC T C AGAC CTCAGTGACC 
CCATGTGGCC ACAGTACACG AACCTGGGGC TCCTGAACGG CAT GGAC C AG CAGATTCAGA 
ACGGCTCCTC ATCTACCAGC CCCTATAACA CAGACCATGC ACAGAACAG C GTGACGGCAC 
CCTCGCCCTA TGCACAGCCC AGCTCAACCT TCGATGCCCT TTCTCCATCC CCTGCCATTC 
CCTCCAACAC AGATTACCCA GGCCCACACA GCTTCGATGT GTCCTTCCAG CAGTCAAGCA 
CCGCCAAGTC AGCTACCTGG ACGTATTCCA CCGAACTGAA G AAACTC T AC TGCCAGATTG 
C AAAGAC C T G CCCCATCCAG ATCAAGGTGA TGACCCCACC CCCACAGGGC GCCGTCATTC 
GTGCCATGCC TGTCTACAAG AAAGCC GAGC ATGTCACCGA GGTTGTGAAA CGATGTCCTA 
ACCACGAGCT GAGCCGCGAG TTCAATGAGG GACAGATTGC CCCTCCCAGT CATCTGATTC 



60 

120 

130 

240 

300 

360 

420 

480 

540 

600 

660 
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GAGTAGAAGG 
TGCTGGTCCC 
T CAT GT GCAA 
CTCTGGAAAC 
CTTGCCCAGG 
AC AG C G C AAA 
AGATGACTTC 
GAGGCCGTGA 
ATCTCCCTCA 
T AC T TCAGAA 
TGAACAAAAT 
AGCGCAACGC 
TGGGCACTCA 
CTCCTCCACT 
AC T GCAGCAT 
CGACCCAGGG 
GTCTGAAGAT 
AGC TGCATGA 
TCAGTGTGGG 
TCCGCCAGAC 
ATTCCCGTCG 
GGTTCTTCCT 
AGCCTTCTCG 
TTAAGAGGCT 
GCCTTCAATA 
GCAGTGGGTC 
TTATAGTCTA 
TATTGAGTAT 
GGAATTTGCT 



GAACAGCCAT 
TTATGAGCCA 
CAGCAGCTGT 
CAGAGATGGG 
AAGAGACCGG 
GAAC GGCGAT 
CATCAAGAAA 
GACTTATGAA 
GCACACGATC 
ACAGACCTCG 
GAACAGCAT G 
CCTGACTCCC 
CATGCCAATG 
CTCCATGCCC 
TGTCAGTTTC 
GCTGACCACC 
CCCTGAGCAG 
CTTCTCCTCA 
CTCCAGTGAG 
CATCTCTTTC 
CAACAAGCAG 
GTTTTCTTCC 
CTAGCTCTCC 
ACCTGTTACC 
CTCTTGCTTG 
TCTCTAAGCA 
AG AC TAT AT A 
TGTTTAAATG 
TGTTTTGGTT 



GCCCAGTATG 
CCACAGGTTG 
GTCGGAGGAA 
CAAGTCCTGG 
AAGGCCGATG 
GGTACGAAGC 
CGGAGATCCC 
ATGCTGCTCA 
GAGACGTACA 
ATGCAGTCTC 
AACAAGCTGC 
ACCACCATGC 
GCTGGAGACA 
TCCACCTCCC 
TTAGCAAGGT 
ATCTATCAGA 
TTCCGACATG 
CCTCCGCATC 
ACCCGTGGAG 
CCACCCCGTG 
CAGCGCATCA 
TCCTCCCAGC 
TCCTCCTCCT 
TAAAGTCTGA 
CAAGATGCGT 
CTGGAGATCG 
TATAAATATA 
TAATTTAATG 
GGCTGATCTG 



TAGAAGATCC 
GCACTGAATT 
TGAACCGCCG 
GCCGACGTTG 
AAGACAGCAT 
GCCCTTTCCG 
CAGATGATGA 
AGATCAAGGA 
GGCAGCAGCA 
AGTCTTCATA 
CGTCTGTGAG 
CTGAGGGCAT 
TGAATGGACT 
ACTGCACCCC 
TGGGCTGTTC 
TTGAGCATTA 
CCATCTGGAA 
TCCTGAGAAC 
AACGTGTGAT 
ATGAGTGGAA 
AAGAGGAAGG 
TCCCACAGGG 
TCTCAGTCTG 
CCTGTCACCT 
TGACATTGCT 
CTCATTGACT 
TAAATATACA 
GAAATCGAGT 
TACCCCTTTC 



TATCACAGGA 
CACAACAGTC 
TCCAATTTTA 
CTTTGAGGCC 
CAGAAAGCAG 
TCAGAATACC 
GCTGCTGTAC 
GTCGCTCGAG 
GCAGCAGCAG 
CGGTAACAGC 
CCAGCTTATC 
GGGAGCCAAC 
CAGCCCCACC 
CCCACCTCCG 
ATCATGTCTG 
CTCCATGGAT 
GGGGATCCTG 
CCCCAGTGGT 
TGATGCCGTG 
CGAT TTCAAC 
AGAATGAACG 
CACGCCTGCT 
GT T TCTAAAG 
GATTCTGATC 
AGATAGACGT 
TTTATAAAGC 
ATATATATTT 
TGCACTTATC 
TCAGGGGTAT 



AGGCAGAGCG 
CTG TACAAT T 
ATCATCGTTA 
CGGATCTGCG 
CAAGTATCAG 
CACGGAATCC 
CTACCAGTGA 
CTCATGCAGT 
CACCAACACC 
TCACCACCTC 
AACCCACAGC 
ATTCCTATGA 
CAAGCTCTTC 
TACCCAACAG 
GACTATTTCA 
GATTTGGCAA 
GACCACAGGC 
GCCTCTACAG 
CGCTTTACTC 
TTTGACATGG 
TCCGTCGCCG 
TGATCCTCAA 
GGAC GGAGAA 
CTGGCTTTAA 
TAGCAGAGAA 
ATTTTCAGCC 
CGGGTGGGGG 
AACCTTCTTT 
CATGTATGGT 



720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
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GACAGAT AT T 


TAGAGTTGAA 


TGGTCTATGT 


GAGTAACAGT GATATATAGG TCCTCTCCTT 


2460 


TCTTTGGATG 


ATTGCCGTTT AGCACATCAA ACCTGTGGAT GCG TCCAGTC TGTTTACCAT 


2520 


TGCTCCTTAT 


GAGGTAAAAC 


TGCATATACT 


GTCAGTCTAT TTTATGTTAC TGGTGTCCAT 


2580 


TCCAGTTAGG 


CTGGTTCACT 


CTGTGGCCAT 


TCCAAGCAAA ATTTTATGTT TGCTTTGTCA 


2640 


CACACTAGAA 


GACAGGGCAT 


CATCTCTTGC 


TTTTGTTTGA GAATGAGGAG TACTTTTTTT 


2700 


TTTTTCTGGA 


AAATCTTAAA 


TGGTCCAAAT 


CAGCCATTCC AAATGGCTGA TGAAATGTAG 


2760 


CCAATATAGC 


AGTTAGCTCT 


CTAAAATTTA 


AGACCCAACA CCCTCGTATT TAT TAG T AAA 


2820 


ACAAAAATGA 


AACATTTGCT 


G T CAT T AGAG 


TAGCCTTAAA ATTAAATTTC AATACCAGAT 


2880 


TGACTGAGTA 


AACTATGCAT 


TCAATGTTGT 


TGTGAGAATT GGGGCTAATT AGTCAGGATG 


2940 


ATTGGAATTT 


GTGTAGTTTT 


TTATGGTGAG 


TTGCAATATC TAT T TAG GAA GGTTCAGGAA 


3000 


TAATAAGAAT 


GACTCAGAAA 


TACTCAATCT 


CCGTGACAAC AGAAAGCAAT CTCACCAAAC 


3060 


TCTGAATTTA AACCCCTTTT 


GAAACATGGA 


GTGAGGCTTG GGAAATGTAC CTTTTAAAGA 


3120 


CTTTCCTATC 


TATAAGACAC 


TGCATGCAGG 


GGCAAGTTTA ATCTCTCATC AAGGTGGAAA 


3180 


ATAAGAATAG 


TAGC TCGGAA 


AC TACAAAC T 


TGCTAGTGTA GCTTTCACAT GGCATGAGCT 


3240 


CAACTATTGT 


TATTTTCCTC 


TTTATCATCA 


AAGCTCCATT GCTGTAGAAA GCAGAGG T GA 


3300 


AGACCCAGTT 


TTCCACCTGA 


CACTTTCCGG 


GCAAGGCATA GACCAAGAAC TGTCTACAAA 


3360 


ACCAGGGCAA AGCTCTTCAG 


TGAAGCTGTT 


TAATTCACAT GGAGAAACAC TTGTTTCCCA 


3420 


CTTTGGGAAA 


GCATGCAACA 


GTGTTCCCCC 


TAGATGTTTT GGAAAC AT T T TGAGTCAAAT 


3480 


ATATTTTTCC 


CAGACTAAAC 


CAGGCTAATG 


AGCTCTACAA TCCTCCTGCA CATTTTGGTA 


3540 


AAGGGCTGTC 


AT TGCACAGG 


AGCTCCCATT 


TTTATCTTAA AGTGCAAATG GGCTAATACG 


3600 


CCTACGAAAT 


GTAATGTATG 


GGTTTTGCCA 


GAAAAT AG T A TATTGTGTAC ACGTGTCTGT 


3660 


GTGTGAGTGT 


GAGAGTGTGT 


GTGTGTGTGT 


GTGTGTGTGT GTGTGTGAAA TTGCATACTA 


3720 


TGCTGGT7TT 


GTTTGTTACT 


CTTTCTCTTG 


GGGATAGTTG GGTTTTCCAG AAC CACAGAC 


3780 


GAAACTTTTT 


TTTGTTGCTG 


TTTTTATATT 


TTTGCAGAAA CACCATTTAG TGAGAATTCA 


3340 


ATGTCAAATT 


AGACATGACA 


CCTTAATTGT 


AAGAAGGGGG GAGAGGGAAA GTTGGTTTTT 


3900 


TTTAATTTTT 


TAAAATTTTG 


TATACTAAAG 


AGAATGAGTC CTTAATTTCA ACATTCTGTT 


3960 


GCATTTAAAT 


AATGATAAGC 


ATCATTAACT 


TCTGTAACAA CTTCCCAGCT TGGCAAATTC 


4020 


AATGCATGGA 


GAACAAAGCT 


GGGCCTTAGC 


CATGTTAGGG AGAAAAATGG CTTCTTGGGG 


4080 
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TTTGGGTTGC 


TTTAGCACCG 


TTGAGGTGGC 


ACAGGGGACT 


CCTGAGGCAT 


4140 


T TCAGCAC 1 A 


rTTArflTAGC 
1 nuu x no^ 


AC T AGGGAC T 


CGGAAAT TCC 


TGTACTGTAG 


CTAATGATTT 


4200 


TGGCGTTCAC 


a «p T ji (Z c W G T 


AGATAGGCCG 


TTTCTCTCCT 


CACACCAGTG 


TTAAGCGTGT 


4260 


Ti f t a fir* f & G 


AGCTGTGGGG 


AAGAGCATGG 


AGAACAGACG 


TCTGCTGGAT 


GCCTCTCACC 


4320 


GGAGAATGAG 


ATTCCTTCGC 


GTGGTGGTGA 


AGTAGGATAG 


GAAGCAGGAG 


TCTCCTTGTT 


4380 


AG TCCAG T TA 


GCTATTGTTT 


TCTTGATATT 


CCCCCCCAAA ACATTGACTA TGAGAGATAT 


4440 


GTGGGGCTTT 


TTTATTTTTA 


TAATTGTACA 


AAATTAAACA AATATGAAAT GTTT TAT AT A 


4500 


CTTTATTAAT 


GTTTTTTTTC 


AAAAGGTACT 


TTCTTATAGA 


CATGATCCTT 


TTTTTACAGG 


4560 


TTCAGTTGCT 


TGTCCCTTGG 


TATTTTTGTG 


TTATGGGCTA 


TGGTGAGCCT 


GAGGCAAATC 


4620 


T ATAAGC CAT 


TTTTGTTTGC 


GAGGACATGC 


AATAAAATTT 


AAAAATAAAT 


GAAAATACAC 


4680 


TGAAAAAAAA 


AAAAAAAAAA 


AAAAAAAA 








4708 



(2) INFORMATION ZU SEQ ID NO: 2: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 4846 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtJLS : cDNS 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 



CGTTGATATC 


AAAGACAGTT GAAGGAAATG 


AATTTTGAAA 


CTTCACGGTG 


TGCCACCCTA 


60 


CAGTACTGCC 


CTGACCCTTA CATCCAGCGT 


TTCGTAGAAA 


CCCCAGCTCA 


TTTCTCTTGG 


120 


AAAGAAAGTT 


ATTACCGATC CACCATGTCC 


CAGAGCACAC 


AGACAAATGA 


ATTCCTCAGT 


180 


CCAGAGGTTT 


TCCAGCATAT CTGGGATTTT 


CTGGAACAGC 


CTATATGTTC 


AGTTCAGCCC 


240 


ATTGACTTGA ACTTTGTGGA TGAACCATCA 


GAAGATGGTG 


CGACAAACAA 


GATTGAGATT 


300 


AGCATGGACT 


GTATCCGCAT GCAGGACTCG 


GACCTGAGTG 


ACCCCATGTG 


GCCACAGTAC , 


360 


ACGAACCTGG 


GGCTCCTGAA C AG CAT GG AC 


CAGCAGATTC 


AGAACGGCTC 


CTCGTCCACC 


420 


AGTCCCTATA 


ACACAGACCA CGCGCAGAAC 


AGCGTCACGG 


CGCCCTCGCC 


C T AC GCACAG 


480 


CCCAGCTCCA 


CCTTCGATGC TCTCTCTCCA 


TCACCCGCCA 


TCCCCTCCAA 


CACCGACTAC 


540 


CCAGGCCCGC 


ACAGTTTCGA CGTGTCCTTC 


CAGCAGTCGA GCACCGCCAA GTCGGCCACC 


600 


TGGACGTATT 


CCACTGAACT GAAGAAACTC 


TACTGCCAAA 


T TGCAAAGAC 


ATGCCCCATC 


660 
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CAGAT CAAGG 


TGATGACCCC ACCTCCTCAG 


GGAGCTGTTA 


TCCGCGCCAT GCCTGTCTAC 


720 


AAAAAAGCTG 


AGCACGTCAC 


GGAGGTGGTG 


AAGCGG TGCC 


CCAACCATGA GCTGAGCCGT 


780 


GAATTCAACG 


AGGGACAGAT 


TGCCCCTCCT 


AGTCATTTGA 


TTCGAGTAGA GGGGAACAGC 


840 


CATGCCCAGT 


ATGTAGAAGA 


TCCCATCACA GGAAGACAGA GTGTGCTGGT ACCTTATGAG 


900 


CCACCCCAGG 


TTGGCACTGA 


ATTCACGACA GTCTTGTACA ATTTCATGTG TAACAGCAGT 


960 


TGTGTTGGAG 


GGATGAACCG 


CCGTCCAATT 


TTAATCATTG 


TTACTCTGGA AACCAGAGAT 


1020 


GGGCAAGTCC 


TGGGCCGACG 


CTGCTTTGAG 


GCCCGGATCT 


GTGCTTGCCC AGGAAGAGAC 


1080 


AGGAAGGCGG 


ATGAAGATAG 


CATCAGAAAG 


CAGCAAGTTT 


CGGACAGTAC AAAGAACGGT 


1140 


GATGGTACGA AGCGCCCGTT 


TCGTCAGAAC 


ACACATGGTA 


TCCAGATGAC ATCCATCAAG 


± C. \J\J 


AAACGAAGAT 


CCCCAGATGA 


TGAACTGTTA 


TACTTACCAG 


TGAGGGGCCG TGAGAC T TAT 


i 9 fin 


GAAATGCTGT 


TGAAGATCAA 


AGAGTCCCTG 


GAACT CAT G C 


AGTACCTTCC TCAGCACACA 


1320 


ATTGAAACGT 


ACAGGCAACA 


GCAACAGCAG 


CAGCACCAGC 


ACTTACTTCA GAAACAGACC 




TCAATACAGT 


CTCCATCTTC 


ATATGGTAAC 


AGCTCCCCAC 


CTCTGAACAA AATGAACAGC 




ATGAACAAGC 


TGCCTTCTGT 


GAGCCAGCTT 


ATCAACCCTC 


AGCAGCGCAA CGCCCTCACT 




CCTACAACCA 


TTCCTGATGG 


CAT GGGAGC C 


AACATTCCCA 


T GAT G GG C AC CCACATGCCA 


1560 


ATGGCTGGAG 


ACATGAATGG 


ACTCAGCCCC 


ACCCAGGCAC 


TCCCTCCCCC ACTCTCCATG 


1620 


CCATCCACCT 


CCCAGTGCAC 


ACCCCCACCT 


CCGTATCCCA CAGATTGCAG CATTGTCAGT 


1680 


TTCTTAGCGA 


GGTTGGGCTG 


T T CAT CATG T 


CTGGACTATT 


TCACGACCCA GGGGCTGACC 


1740 


ACCATCTATC 


AGATTGAGCA 


TTACTCCATG 


GATGATCTGG 


CAAGTCTGAA AATCCCTGAG 


1800 


CAATTTCGAC 


ATGCGATCTG 


GAAGGGCATC 


CTGGACCACC 


GGCAGCTCCA CGAATTCTCC 


18 60 


TCCCCTTCTC 


ATCTCCTGCG 


GACCCCAAGC 


AGTGCCTCTA 


CAGTCAGTGT GGGCTCCAGT 


1920 


GAGACCCGGG 


GTGAGCGTGT 


TATTGATGCT 


GTGCGATTCA 


CCCTCCGCCA GACCATCTCT 


1980 


TTCCCACCCC 


GAGAT GAG T G 


GAATGACTTC 


AACTTTGACA 


TGGATGCTCG CCGCAATAAG 


z. u *4 U 


CAACAGCGCA 


TCAAAGAGGA 


GGGGGAGTGA 


GCCTCACCAT 


GTGAGCTCTT CCTATCCCTC 


2100 


TCCTAACTGC 


CAGCNCCCTA 


AAAGCACTCC 


TGCTTAATCT 


TCAAAGCCTT CTCCCTAGCT 


2160 


CCTCCCCTTC 


CTCTTGTCTG 


ATTTCTTAGG 


GGAAGGAGAA 


GTAAGAGGCT ACCTCTTACC 


2220 


TAACATCTGA 


CCTGGCATCT 


AATTCTGATT 


CTGGCTTTAA 


GCCTTCAAAA CTATAGCTTG 


2280 


CAGAACTGTA 


GCTGCCATGG 


CTAGGTAGAA 


GTGAGCAAAA 


AAGAGTTGGG TGTCTCCTTA 


2340 


AGCTGCAGAG 


ATTTCTCATT 


GACTTTTATA AAG CAT G T TC 


ACCCTTATAG TCTAAGACTA 


2400 
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TATATATAAA 


TGTATAAATA 


TACAGTATAG ATTTTGGGTG GGGGGGCATT GAGTATTGTT 


2460 


TAAAATGTAA 


TTTAAATGAA AGAAGATTGA GTTGCACTTA TTGACCATTT TTTAATTTAC 


2520 


TTGTTTTGGA 


TGGCTTGTCT 


ATACTCCTTC 


CCTTAAGGGG TATCATGTAT GGTGATAGGT 


2580 


ATCTAGAGCT 


TAATGCTACA 


TGTGAGTGAC 


GATGATGTAC AGATTCTTTC AGTTCTTTGG 


2640 


ATTCTAAATA 


CATGCCACAT 


CAAACCTTTG 


AGTAGATCCA TTTCCATTGC TTATTATGTA 


2700 


GGTAAGACTG 


TAGATATGTA 


TTCTTTTCTC 


AGTGTTGGTA TAT T T TAT AT TACTGACATT 


2760 


TCTTCTAGTG 


ATGATGGTTC 


ACGTTGGGGT 


GATTTAATCC AGTTATAAGA AGAAGT T CAT 


2820 


GTCCAAACGT 


CCTCTTTAGT 


TTTTGGTTGG 


GAATGAGGAA AATTCTTAAA AGGCCCATAG 


2880 


CAGCCAGTTC 


AAAAACACCC 


GACGTCATGT 


ATTTGCGCAT AT CAG T AAC C CCCTTAAATT 


2940 


TAATACCAGA 


TACCTTATCT 


TACAATATTG 


ATTGGGAAAA CATTTGCTGC CATTACAGAG 


3000 


GTATTAAAAC 


TAAATTTCAC 


TACTAGATTG 


AC T AAC T CAA ATACACATTT GC T AC T GT T G 


3060 


TAAGAATTCT 


GATTGATTTG 


ATTGGGATGA 


ATGCCATCTA TCTAGTTCTA ACAGTGAAGT 


3120 


TTTACTGTCT 


ATTAATATTC 


AGGGTAAATA 


GGAATCATTC AGAAATGTTG AGTCTGTACT 


3180 


AAACAGTAAG 


ATATCTCAAT 


GAACCATAAA 


TTCAACTTTG TAAAAATCTT TTGAAGCATA 


3240 


GATAATATTG 


TTTGGTAAAT 


GTTTCTTTTG 


TTTGGTAAAT GTTTCTTTTA AAGACCCTCC 


3300 


TATTCTATAA AACTCTGCAT 


GTAGAGGCTT 


GTTTACCTTT CTCTCTCTAA GGTTTACAAT 


3360 


AGGAGTGGTG 


ATTTGAAAAA 


TATAAAATTA 


TGAGATTGGT TTTCCTGTGG CAT AAAT T GC 


3420 


ATCAC TGTAT 


CATTTTCTTT 


TTTAACCGGT 


AAGAGTTTCA GTTTGTTGGA AAGTAACTGT 


3480 


GAG AAC C CAG 


TTTCCCGTCC 


ATCTCCCTTA 


GGGACTACCC AT AGACAT G A AAGGTCCCCA 


3540 


CAGAGCAAGA GATAAGTCTT 


TCATGGCTGC 


TGTTGCTTAA AC C AC T T AAA CGAAGAGTTC 


3600 


CCTTGAAACT 


TTGGGAAAAC 


ATGTTAATGA 


CAATATTCCA GATCTTTCAG AAATATAACA 


3660 


CATTTTTTTG 


CAT GC AT GC A 


AATGAGCTCT 


GAAATCTTCC CATGCATTCT GGTCAAGGGC 


3720 


TGTCATTGCA 


CATAAGCTTC 


CATTTTAATT 


TTAAAGTGCA AAAGGGC CAG CGTGGCTCTA 


3780 


AAAGGTAATG 


TGTGGATTGC 


CTCTGAAAAG 


TGTGTATATA TTTTGTGTGA AATTGCATAC 


3840 


TTTGTATTTT 


GATTATTTTT 


TTTTTCTTCT 


TGGGATAGTG GGATTTCCAG AACCACACTT 


3900 


GAAACCTTTT 


TTTATCGTTT 


TTGTATTTTC 


A TGAAAATAC CAT T TAG T AA GAATACCACA 


3960 


TCAAATAAGA AATAATGCTA CAATTTTAAG 


AGGGGAGGGA AGGGAAAGTT TTTTTTTATT 


4020 


ATTTTTTTAA AATTTTGTAT 


GTTAAAGAGA 


ATGAGTCCTT GATTTCAAAG TTTTGTTGTA 


4080 
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CTTAAATGGT 


AATAAGCACT 


GTAAACTTCT 






4140 


AAGGGGAAGA 


ATGAAAGCTG 


TTCCTTGGTC 


C TAG T AAGAft wxAt^AM/tu luc 


TTPrrTTATT 


4200 


TTGCTGAGGG 


TTTGAATAAA 


CCTAGGACTT 


CC GAGC TATG T CALj I AL 1 A i 


1 Lnbu 1 /xrvv^M 


42 60 


CTAGGGCCTT 


GGAAATTCCT 


GTACTGTGTC 


TCATGGATTT GGCACTAGCC 


AAAbU<jA(jQjC 




ACCCTTACTG 


GCTTACCTCC 


TCATGGCAGC 


CTACTCTCCT TGAGTGTATG 


AGT AGC CAGG 




GTAAGGGGTA 


AAAGGATAGT 


AAGCATAGAA 


ACCACTAGAA AGTGGGCTTA 


ATGGAGTTCT 


A A A f\ 


TGTGGCCTCA 


GCTCAATGCA 


GTTAGCTGAA 


GAATTGAAAA GTTTTTGTTT 


GGAGACGTTT 


4500 


ATAAACAGAA 


ATGGAAAGCA 


GAGTTTTCAT 


TAAATCCTTT TACCTTTTTT 


TTTTCTTGGT 


4560 


AATCCCCTAA 


AATAACAGTA 


TGTGGGATAT 


TGAATGTTAA AGGGATATTT 


TTTTTCTATT 


4620 


ATTTTTATAA 


TTGTACAAAA 


TTAAGCAAAT 


GTTAAAAGTT TTATATGCTT 


TATTAATGTT 


4680 


TTCAAAAGGT 


AT T AT ACA T G 


TGATACATTT 


TTTAAGCTTC AGTTGCTTGT 


CTTCTGGTAC 


4740 


TTTCTGTTAT 


GGGCTTTTGG 


GGAGCCAGAA 


GCCAATCTAC AATCTCTTTT 


TGTTTGCCAG 


4800 


GACATGCAAT 


AAAATTTAAA AAATAAATAA AAACTAATTA AGAAAT 




4846 



(2) INFORMATION ZU SEQ ID NO: 3: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 680 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREI3UNG: SEQ ID NO: 3: 

Met Asn Phe Glu Thr Ser Arg Cys Ala Thr Leu Gin Tyr Cys Pro Asp 
1 5 10 15 

Pro Tvr lie Gin Arg Phe Val Glu Thr Pro Ala His Phe Ser Trp Lys 
20 25 30 

Glu Ser Tvr Tyr Arc Ser Thr Met Ser Gin Ser Thr Gin Thr Asn Glu 
35 40 45 

Phe Leu Ser Pro Glu Val Phe Gin His He Trp Asp Phe Leu Glu Gin 
50 55 60 

o ro He Cys Ser Val Gin Pro He Aso Leu Asn Phe Val Asp Glu Pro 
65 70 75 80 

Ser Glu Asp Gly Ala Thr Asn Lys He Glu lie Ser Met Asp Cys He 



85 



90 



95 



♦ 
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Arg Met Gin Asp Ser Asp Leu Ser Asp Pro Met Trp Pro Gin Tyr Thr 
100 105 110 

Asn Leu Gly Leu Leu Asn Ser Met Asp Gin Gin lie Gin Asn Gly Ser 
115 120 125 

Ser Ser Thr Ser Pro Tyr Asn Thr Asp His Ala Gin Asn Ser Val Thr 
130 135 140 

Ala Pro Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Ala Leu Ser 
145 150 155 160 

Pro Ser Pro Ala lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His Ser 
165 170 175 

Phe Asp Val Ser Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp 
180 185 190 

Thr Tyr Ser Thr Glu Leu Lys Lys Leu Tyr Cys Gin He Ala Lys Thr 
195 200 205 

Cys Pro He Gin He Lys Val Met Thr Pro Pro Pro Gin Gly Ala Val 
210 215 220 

He Arg Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Glu Val 
225 230 235 240 

Val Lys Arg Cys Pro Asn His Glu Leu Ser Arg Glu Phe Asn Glu Gly 
245 250 255 

Gin He Ala Pro Pro Ser His Leu He Arg Val Glu Gly Asn Ser His 
260 265 270 

Ala Gin Tyr Val Glu Asp Pro He Thr Gly Arg Gin Ser Val Leu Val 
275 280 235 

Pro Tyr Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr Val Leu Tyr 
290 295 300 

Asn Phe Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro 
305 310 315 320 

He Leu He He Val Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly 
325 330 335 

Arg Arg Cys Phe Glu Ala Arc He Cys Ala Cys Pro Gly Arg Asp Arg 
340 345 350 

Lys Ala Asp Glu Asp Ser He Arg Lys Gin Gin Val Ser Asp Ser Thr 
355 360 365 

Lys Asn Gly Asp Gly Thr Lys Arg Pro Phe Arg Gin Asn Thr His Gly 
370 375 380 

lie Gin Met Thr Ser He Lys Lys Arg Arg Ser Pro Asp Asp Glu Leu 
385 390 395 400 
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Leu Tyr Leu Pro Val Arg Gly Arg Glu Thr Tyr Glu Met Leu Leu Lys 
405 410 415 

He Lys Glu Ser Leu Glu Leu Met Gin Tyr Leu Pro Gin His Thr He 
420 425 430 

Glu Thr Tyr Arg Gin Gin Gin Gin Gin Gin His Gin His Leu Leu Gin 
435 440 445 

Lys Gin Thr Ser He Gin Ser Pro Ser Ser Tyr Gly Asn Ser Ser Pro 
450 455 460 

Pro Leu Asn Lys Met Asn Ser Met Asn Lys Leu Pro Ser Val Ser Gin 
465 470 475 480 

Leu He Asn Pro Gin Gin Arg Asn Ala Leu Thr Pro Thr Thr He Pro 
485 490 495 

Asp Gly Met Gly Ala Asn He Pro Met Met Gly Thr His Met Pro Met 
500 505 510 

Ala Gly Asp Met Asn Gly Leu Ser Pro Thr Gin Ala Leu Pro Pro Pro 
515 520 525 

Leu Ser Met Pro Ser Thr Ser Gin Cys Thr Pro Pro Pro Pro Tyr Pro 
530 535 540 

Thr Asp Cys Ser He Val Ser Phe Leu Ala Arg Leu Gly Cys Ser Ser 
545 550 555 560 

Cys Leu Asp Tyr Phe Thr Thr Gin Gly Leu Thr Thr He Tyr Gin He 
565 570 575 

Glu His Tyr Ser Met Asp Asp Leu Ala Ser Leu Lys He Pro Glu Gin 
580 585 590 

Phe Arg His Ala He Trp Lys Gly He Leu Asp His Arg Gin Leu His 
595 600 605 

Glu Phe Ser Ser Pro Ser His Leu Leu Arg Thr Pro Ser Ser Ala Ser 
610 615 620 

Thr Val Ser Val Gly Ser Ser Glu Thr Arg Gly Glu Arg Val He Asp 
625 630 635 640 

Ala Val Arg Phe Thr Leu Arg Gin Thr He Ser Phe Pro Pro Arg Asp 
645 650 655 

Glu Trp Asn Asp Phe Asn Phe Asp Met Asp Ala Arg Arg Asn Lys Gin 
660 665 670 

Gin Arg lie Lys Glu Glu Gly Glu 
675 680 



